Analyse morphologique non supervisée en domaine biomédical. Application à la recherche d'information
نویسندگان
چکیده
In the biomedical field, using of specialized terms is key to access information. However, in most Indo-European languages, these terms are complex morphological structures. The presented work aims at identifying the various meaningful components of these terms and use them to improve biomedical Information Retrieval (IR). We present different approaches combining automatic alignments with a pivot language, Japanese, and analogical learning that allows an accurate morphological analysis of terms. These morphological analysis are used to improve the indexing of medical documents. The experiments reported in this paper show the validity of this approach with a 10% MAP improvement over a standard IR system. MOTS-CLÉS : morphologie, terminologie biomédicale, alignement, apprentissage par analogie, indexation morphosémantique, recherche d’information biomédicale.
منابع مشابه
Classification non supervisée floue des termes basée sur la proximité pour les systèmes de recherche d'information
RÉSUMÉ. Le regroupement des termes basé sur la mesure de proximité est une stratégie menant efficacement à trouver les documents pertinents. Contrairement à ce qu’ont montré les études récentes qui ont utilisé la proximité des termes pour le classement des documents, le processus de recherche d’information est entièrement revu dans ce travail en ce qui concerne les étapes d’indexation et d’inte...
متن کاملTexte et Représentation en Recherche d'Information
Les performances des modèles de Recherche d'Information (RI) sont for-tement liées à leur capacité à représenter le texte. Ces dernières années, portés par les succès en reconnaissance d'image et de parole, de nombreux modèles basés sur les réseaux de neurones et les représentations distri-buées des mots et phrases sont apparus. Quelques modèles ont essayé d'aborder le problème de la RI, dont u...
متن کاملIndexation et intégration de ressources textuelles à l'aide d'ontologies : application au domaine biomédical
Résumé : De nombreuses découvertes scientifiques sont contraintes aujourd’hui par la difficile intégration des données misent à disposition dans différentes ressources. L’utilisation d’ontologies pour indexer et intégrer les ressources de données est un moyen de valoriser la connaissance d’un domaine en facilitant la recherche et la fouille de données. Dans cet article nous présentons un mécani...
متن کاملTraduction automatique de termes biomédicaux pour la recherche d'information interlingue
RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...
متن کاملFouille de graphes et découverte de règles d'association : application à l'analyse d'images de document
Résumé. Cet article présente une méthode permettant la découverte non supervisée de motifs fréquents représentatifs de symboles sur des images de documents. Les symboles sont considérés comme des entités graphiques porteurs d’information et les images de document sont représentées par des graphes relationnels attribués. Dans un premier temps, la méthode réalise la découverte de sous-graphes dis...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- TAL
دوره 54 شماره
صفحات -
تاریخ انتشار 2013